iT邦幫忙

2023 iThome 鐵人賽

DAY 22
0

本文內容為資料生命週期管理應備的規範或活動,非實作所用到的 IT 技術。

Data Management 資料管理,只是個概稱

其實,資料管理目前仍是個概稱,每個人賦予這個詞彙的內涵都不一樣,寫文章可以用,不建議放在專案「工作項目」、  「交付項目」或「效益」上。

「資料管理」一詞很不容易劃定討論範疇,其中一個原因是資料領域還在蓬勃發展中。即使已經發展很成熟的領域,把該領域名稱直接加上「管理」二字,也不適合拿來當作實作項目。舉例來說,我們不會把人力資源管理,直接當成「工作項目」、  「交付項目」或「效益」,我們會細化成更加具體的工作項目,例如刊登招募廣告。

Data Lifecycle Management 資料生命週期管理

「資料管理」可以解為 Data Lifecycle Management 「資料生命週期管理」以具體化實作範圍。本文參考 DAMA 國際資料管理協會的「資料生命週期管理」體系。

DAMA 在 2009 年發布第一版 DMBOK(資料管理與知識體系指南)。2017 年發表 DMBOK 2.0, 整個資料治理範疇沒有太大改變,但是結構卻有很大的精進,把「知識範疇」(清單)進化到「知識結構」(多維)。還把 10 大知識領域進化成下面的 DMBOK 2 Evolved Wheel :
https://ithelp.ithome.com.tw/upload/images/20230925/20161790naljHYmcNi.png
圖片來源:https://www.dama.org/cpages/dmbok-2-wheel-images

DAMA 是引用 PDCA 模型來解構 「資料生命週期管理」規範與活動

Plan & Design 以及 Use & Enhance 大家應該比較容易想像。本文針對 Enable & Maintain 來說明:

  1. Big Data Storage:DAMA 主要是專注在「政策」、「組織」、「流程」標準上,我很驚訝 DAMA 的專家在 IT 技術面的著墨,特別把「大數據」儲存獨立出來。確實在架構、規格與服務層級上,PB 量級的大數據儲存不太適合跟 TB 量級的資料儲存做相同處理。這樣的區分也有助企業去審視是否真的需要建置大數據系統。
  2. Data Warehousing:企業應建立可流通的資料倉儲架構文件、資料產品標準、釋出計畫、支援程序、監控程序。
  3. Master Data Management:Master Data Management 我們會有專篇來講。本文先不談。
  4. Data Storage and Operations:企業應建立資料庫技術評估標準、資料庫環境標準、資料庫備份與遷移指引、營運持續計畫、資料庫效能與可用性標準。
  5. Reference Data Management:Reference Data 是指非 Data,也非 Metadata, 但是在資料使用時,會需要查詢的參考資料。例如 code table 代碼表。企業應建立參考資料需求文件指引,在建立 Data Catalog & Model 時不要漏掉 Reference Data。
  6. Data Integration and Interoperability:企業應建立 DLL 架構文件、資料交換規格標準、資料存取協定、資料服務標準、事件警示機制。

看到這裡,應該可以理解為何「資料治理」與「數位轉型」如此緊密。企業需要獨立於 IT 外的 Data Team 來推動資料治理,但是 Data Team 需要跟 IT Team 緊密合作才能讓資料專案成功。


上一篇
Data Governance (資料治理,企業資料組織、流程與技術的最高指導原則)
下一篇
Data Quality and Data Verification (有資料驗證才有資料品質)
系列文
吵什麼 AI 煉金術?!你家有礦嗎?(資料領域必知的 30 個詞彙)30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言